AI Compute Supply Chain 的再分层:陈立武 No Priors 访谈深读

本文基于 No Priors 在 2026 年 6 月 18 日发布的访谈《Re-engineering the Semiconductor Supply Chain with Intel CEO Lip Bu Tan》. 涉及公司交易、任命和产品合作的事实,以公开资料为准

0. Overview

这期访谈最值得思考的地方,不在“Intel 能不能复兴”,而是AI 基础设施的瓶颈,正在从单颗 GPU 向一整条供给链扩散
这条链里有 HBM、CoWoS、substrate、power delivery、data center power、interconnect、foundry 良率、cycle time,也有 CUDA、scheduler、agent orchestration 这些软件层问题。很多环节平时不在聚光灯下,可一旦卡住,系统就交不出来。
所以这篇文章会把 Intel 放在最后看。先看 workload,先看 bottleneck,再看供应链、公司组织、资本和 application 怎么被重组,最后再回头看 Intel 手里的牌到底能不能组成一套可交付的系统。

1. 瓶颈正在迁移

标题把这期节目包装成 Intel CEO 访谈,这是合理的。陈立武刚接任 Intel,Intel 又处在政府入股、NVIDIA 投资、SoftBank 下注、foundry 重建这些事件的交汇点上,观众自然会把问题简化成:Intel 还能不能回来?但越往后听,越觉得访谈真正有价值的地方不在这里。
陈立武反复谈到的是一组供给链问题:电力、氦气、内存、先进封装、材料、互连、制造产能、客户信任、政府资本、软件栈、组织反馈。单独看,每个点都不新;放在一起看,问题就变了:
AI compute 的瓶颈,正在从“谁有更强 accelerator”,转向“谁能组织一条可持续扩张的 compute supply chain”。
这并不削弱 GPU 的重要性。GPU 仍然是 AI 训练时代的核心资产。只是 GPU 已经把需求拉到了一个高度,接下来越来越多瓶颈会暴露在 GPU 之外。
这张图里,每一层都可能成为约束。GPU 供应缓解后,HBM 可能变成瓶颈;HBM 扩出来后,advanced packaging 可能变成瓶颈;封装扩出来后,电力和散热可能变成瓶颈;系统规模上去后,interconnect 和软件调度又会变成瓶颈。
后面所有讨论,都围绕这个判断展开:AI 基础设施不能再按单线赛道理解,它是一组不断迁移的系统瓶颈

2. Demand Side:别把所有 AI demand 都叫“算力需求”

很多讨论把 AI demand 合并成一个词:算力需求。这个说法方便,也容易误导。训练、推理、agentic AI、physical AI 用到的系统能力并不一样。
陈立武在访谈里提到一个细节:训练场景里 CPU:GPU 可能接近 1:8,但在 agentic AI 和 inference 场景里,比例可能走向 1:4,甚至更接近 1:1。这句话如果只被理解成“CPU 又重要了”,会低估它的系统含义。
先把几个 workload 摆开:
Workload
主要压力
CPU / control plane 价值
关键瓶颈
Training
大规模矩阵计算、collective communication、HBM
host orchestration 重要,但价值中心在 accelerator
GPU、HBM、interconnect、电力
Prefill inference
长上下文输入、prompt processing、batching
请求合并、上下文切分、cache 管理
GPU 吞吐、HBM 带宽、KV cache
Decode inference
token-by-token 生成、低延迟、长会话
scheduler、queueing、memory 管理权重上升
显存容量、memory bandwidth、latency
Agentic inference
工具调用、检索、路由、权限、状态管理
CPU、I/O、network、orchestration 变得更关键
control flow、data movement、端到端延迟
Physical AI
感知、仿真、机器人、边缘实时控制
edge compute、异构系统、可靠性工程更重要
power、thermal、安全冗余、软件栈
也可以换成一张更直观的图来看:
训练更像“把大规模计算集中起来”。Agentic inference 则更像“把一堆服务、模型、工具、数据源和执行环境编排起来”。后者的关键已经从单次 forward pass,扩展到端到端工作流。
在 agentic 系统里,一个请求可能经过:
  1. 用户意图解析;
  1. 路由到不同模型;
  1. 检索外部知识库;
  1. 调用工具、代码环境或企业系统;
  1. 执行权限和安全检查;
  1. 多轮推理和中间状态管理;
  1. 后处理、审计和返回结果。
这个链路里 GPU 仍然承担重计算,但 CPU、memory、network、storage、orchestration 和 software stack 的存在感会上升。所以,Intel 所说 CPU 重新变重要,不能简单理解为老式服务器 CPU 叙事的回归。更合理的解释是:AI serving path 变复杂以后,control plane 被重新定价
这里还要区分两类 inference。 prefill 更接近吞吐问题,长 prompt 和大 batch 会拉高 GPU 和 HBM 压力; decode 更接近延迟和显存问题,KV cache 会随着并发会话和上下文长度膨胀。一个服务商表面上买的是 GPU,实际消耗的是一组资源:GPU compute、HBM 容量、HBM bandwidth、CPU 调度、NIC、storage、runtime scheduler 和故障恢复能力。
Physical AI 又是另一种约束。机器人、自动驾驶、工业设备、无人系统更在乎实时性、功耗、散热、可靠性和安全冗余。它们未必总在云端运行,很多决策要靠 edge system 完成。这个场景里,CPU、NPU、GPU、sensor pipeline、network、real-time OS 和安全控制会一起进入设计空间。
这里要加一个边界:CPU 变重要不等于 Intel 自动受益。客户是否采用 Intel CPU,取决于平台集成、性能功耗、总拥有成本、与 accelerator 的互连、软件生态和采购路径。NVIDIA 与 Intel 的合作之所以值得看,原因也在这里:它可能改变 CPU 与 AI infrastructure 的连接方式,而不只是财务投资。

3. 先问 workload,再问芯片

AI 基础设施研究容易犯一个错误:先选公司,再给公司找叙事。
我更愿意倒过来:先看 workload,再看瓶颈,最后才看哪个公司有能力捕获这个瓶颈。
问题
看什么
对应瓶颈
这个 workload 是训练、prefill、decode、agentic,还是 physical AI?
计算密度、上下文长度、并发、实时性
compute、memory、latency、edge constraints
它是 compute-bound 还是 memory-bound?
GPU 利用率、HBM bandwidth、KV cache 命中、batch size
accelerator、HBM、serving runtime
它的集群规模多大?
单机、多机、rack、跨数据中心
GPU-GPU、NIC、switch、optical
它的上线瓶颈在哪里?
GPU 到货、电力接入、机房冷却、封装交期
supply chain、data center、packaging
它对软件生态的依赖多重?
CUDA、kernel library、scheduler、observability
platform、developer ecosystem
这几个问题看起来像常识,但能过滤掉很多无效讨论。
如果一个 workload 的瓶颈是 KV cache 和低延迟 decode,只讨论 GPU FLOPS 就不够。你还要看显存容量、memory bandwidth、continuous batching、prefix cache、speculative decoding、disaggregated prefill/decode 这类 serving 技术能不能降低单位 token 成本。
如果瓶颈是 multi-node training scaling efficiency,问题又变成 collective communication、cluster topology、网络拥塞、failure recovery 和数据中心电力。此时单卡性能漂亮,不代表系统效率漂亮。
如果瓶颈是 physical AI 的边缘部署,云端大训练集群的经验只解决一部分问题。设备端功耗、实时控制、环境鲁棒性和安全认证,会比峰值算力更早进入约束。
这也解释了为什么陈立武会把 agentic AI、physical AI、CPU、foundry、advanced packaging 放在同一场访谈里谈。表面看话题跳跃,底层其实是一条线:workload 正在分化,供给侧必须跟着重排

4. Power:最难绕开

陈立武谈 AI 增长瓶颈时,先提到 power constraint。我觉得这个排序不能忽略。
AI 叙事通常从模型和 GPU 开始,但大规模 AI 基础设施最后要落到电力、土地、冷却、水、变电站、输电、数据中心建设周期。训练集群、推理集群和 fab 都是重资产系统。软件需求可以在几个月内增长,电力和数据中心建设不是这样。
Power 至少有三个层面:
Power 类型
发生位置
影响
Grid / data center power
AI data center、training cluster、inference region
决定可部署集群规模和上线节奏
Fab / manufacturing utilities
晶圆厂、封装厂、关键设备与洁净室
决定制造和扩产节奏
On-package / board power delivery
accelerator、HBM、chiplet package、server board
决定性能密度、热设计和可靠性
第一层是基础设施问题,第二层是制造供给问题,第三层是硬件系统设计问题。它们不在同一个部门里,却会一起限制 AI 供给。
访谈里还提到 helium。氦气不会出现在大多数 AI 新闻标题里,却可能与半导体制造、低温环境、设备工艺和供应链稳定性相关。它提醒我们:AI compute supply chain 里有很多隐蔽变量。它们平时不是故事主角,缺的时候就会变成主角
这类变量有几个共同点:
  • 可替代性低;
  • 扩产周期长;
  • 地理和供应商集中度高;
  • 平时不被关注,紧张时突然变成系统性约束。
研究 AI infra 时,不能只追踪 GPU 出货。电力接入、冷却方案、关键气体、设备交期和数据中心 pipeline,都应该被放到同一个观察表里
Power 也会改变产业组织方式。谁能提前锁定电力、土地、冷却资源和长期资本,谁就会从“买芯片的人”变成 AI factory 的组织者。云厂商、主权基金、能源公司、数据中心运营商和芯片公司会更深地绑在一起。这是传统互联网基础设施里没那么突出的变化。

5. AI 正在重新分配国家、公司和供应链的位置

访谈里主持人问的是 AI 对国家层面的影响:有些国家过去承接 BPO (Business Process Outsourcing Countries)、外包客服、外包 IT;有些地方有便宜能源;少数国家能训练 frontier model;还有以色列、菲律宾、印度这类国家,是否应该重新看待半导体和制造。
这段不只是闲聊。它其实把 AI 对全球分工的冲击说得很直白:AI 会替代某些岗位,也会重新分配国家和公司的位置。
可以粗略分成几类:
位置
过去的优势
AI 时代的新问题
BPO / 外包服务国家
便宜劳动力、英语能力、服务交付体系
客服、IT support、重复流程会先被自动化挤压
能源富集地区
电力便宜、土地和基础设施可用
可能承接 data center,但未必能拥有模型或应用入口
半导体制造地区
工程人才、制造经验、供应链配套
需要更高资本密度、更强客户信任和先进封装能力
模型和应用中心
顶级人才、资本、客户和软件生态
能捕获更高层价值,但也受物理供给限制
所以,“AI supply chain”不能只理解成芯片供应链。它同时是国家分工、能源分工、劳动力分工和资本分工。
主持人提到 BPO 国家可能先受影响,这一点值得保留。很多人谈 AI 替代时,会直接跳到白领失业的宏大叙事;但现实里,企业往往会先砍外部 headcount,比如外包客服、外包 IT、外包流程服务。这个变化不会一次性摧毁某个国家的服务业,但会改变它们在全球价值链里的位置。
反过来,有便宜能源的地方可能参与 data center;有制造基础的地方可能参与封装、测试、设备维护;有强软件生态和资本能力的地方可能控制模型、runtime 和应用入口。AI 把“数字经济”重新接回了电力、土地、制造和国家产业能力。
这也是我觉得陈立武这期访谈比普通 CEO 访谈有意思的地方。他不只在讲 Intel 的产品线,也在讲一个更旧、更硬的问题:当一个技术周期变成基础设施周期,谁有资格参与,谁只能承接受限的一段

6. HBM、CoWoS、Power 往往是一组问题

这里是我觉得最需要说清楚的地方。AI supply chain 的瓶颈经常不是排队出现,而是互相锁住。
可以把它简化成一条链:
这条链的含义很朴素:你不能只扩一个环节。
GPU die 做出来,如果没有足够 HBM 和封装产能,不能变成可交付系统。HBM 产能增加,如果先进封装、substrate、interposer、测试和良率跟不上,也会卡在系统出货前。封装做大以后,供电、散热、机械稳定性和可靠性会继续变难。整机功耗上去以后,数据中心电力和冷却又会变成上线约束。
这也是 AI 硬件周期和软件周期之间最别扭的地方。软件侧可以在一个季度内把需求曲线打上去;半导体侧要经历材料、设备、工艺、封装、测试、客户认证和产能爬坡。某个环节短缺时,价格会先涨,排期会变长,然后客户会重新设计系统或提前锁单
从投资和产业观察角度看,只知道“哪里短缺”还不够,关键要判断这个短缺有没有持续性:
判断问题
如果答案是“是”
如果答案是“否”
这个环节扩产是否需要专用设备和长周期认证?
短缺可能持续,议价权更强
供给可能较快恢复
它是否绑定客户设计和软件栈?
客户迁移慢,领先者优势更稳
替代品更容易进入
它是否同时受材料、设备、良率约束?
产能爬坡更难预测
主要是资本开支问题
它是否影响系统级 TCO?
客户愿意为改进付钱
只能做局部优化
这也是陈立武“customer crying for it?” 这句话的价值所在。客户真的痛,通常不是因为一个指标落后,而是整个系统被卡住了:GPU 在等 HBM,HBM 在等封装,机柜在等电力,工程团队在等软件栈稳定。
所以,AI supply chain 的研究不能只画供应商名单。更有用的是画依赖关系:哪个环节被谁约束,谁有第二来源,谁可以替代,谁必须跟客户路线图绑定

7. Memory 和 data movement 正在被重新定价

AI 系统有一个越来越明显的事实:计算越来越强,但把数据喂给计算单元越来越难。
访谈里多次出现 memory shortage。这里的 memory 覆盖普通 DRAM、HBM 和更广义的数据移动能力。对于大模型训练和推理,HBM bandwidth、容量、封装连接方式、KV cache 管理、host-device 数据移动,都可能决定系统效率。
GPU 的峰值 FLOPS 很容易被展示,memory bottleneck 却更接近真实部署成本。一个 accelerator 如果算力很强,但 memory bandwidth、interconnect 或 serving stack 无法持续供数,最终有效吞吐会被打折。
这个问题可以拆成四层:
层次
问题
典型后果
On-chip / on-package memory
HBM bandwidth、容量、堆叠和封装能力
accelerator 被喂不饱,batch 或 context 受限
Node-level data movement
CPU-GPU、GPU-GPU、NIC-GPU、storage-GPU 路径
latency 上升,serving 成本变高
Cluster-level interconnect
rack 内外通信、collective、参数/激活/缓存移动
scaling efficiency 下降
Serving-level cache movement
KV cache、prefix cache、跨实例迁移
decode 成本和尾延迟上升
这里最容易被低估的是 inference。训练阶段讨论 HBM 很自然,推理阶段很多人会先看 token/s 或单卡吞吐。但在真实服务里,KV cache 会吃掉大量显存,长上下文会放大 memory pressure,高并发会把调度问题变成成本问题。模型越像服务,memory 越不能被当成附属品。
这也解释了 optical interconnect 为什么会被陈立武提到。他谈投资时问 interconnect 是否正在成为 bottleneck,并提到 Celestial AI 这样的 optical 方向。这个信号不能直接推出“光互连一定胜出”,它更像一个提醒:当 cluster 内数据移动的功耗、延迟和带宽成为约束,电互连之外的路径会被重新评估。
这类投资方向的验证标准很硬:
  • 是否真的降低系统级功耗,而非只是在链路指标上漂亮;
  • 是否能进入主流封装和板级设计;
  • 是否能在云厂商规模化环境里稳定运行;
  • 是否有明确客户愿意承担迁移风险;
  • 是否能和现有 accelerator / NIC / switch 生态协同。
所以我对 memory 和 interconnect 的判断比较直接:AI infra 的稀缺性正在从 compute die 扩散到 data movement。

8. Packaging 和材料已经不是“后段小事”

💡
术语小抄:这里的 packaging 已经不是普通中文里说的“封装外壳”。它指的是把 compute die、HBM、I/O、供电和散热通路组合成可量产系统的集成工程。CoWoS 是 TSMC 的 2.5D advanced packaging 路线;EMIB / Foveros 是 Intel 的 chiplet / 3D 集成路线。substrate 可以粗略理解为承载和连接 die 的高端“底板”,interposer 是更细密的中介层,die-to-die 指多个裸片之间的高速连接。GaN、SiC、InP 分别常和功率转换、高压高频、光互连相关。
访谈里关于 packaging 和 materials 的部分,是整期里技术密度最高的段落之一。陈立武提到 TSMC 的 CoWoS,也提到 Intel 的 EMIB / advanced packaging,再往下谈到 glass、artificial diamond、gallium nitride、silicon carbide、indium phosphide。
这些词放在一起,不能只当材料清单看。它们说的是同一件事:当 transistor scaling 的经济性变差,性能增长会更多依赖 package-level 和 system-level innovation。
过去半导体性能提升主要沿着 process node 叙事展开。更先进节点意味着更高密度、更好功耗、更高性能。这个叙事仍然有效,但已经不足以解释 AI 系统需求。
AI accelerator 需要把 compute die、HBM、I/O、power delivery、thermal path、substrate、interconnect 放到一个可量产 package 里。此时 packaging 不再只是“封装”,而成为系统架构的一部分。
技术方向
对应约束
关键问题
CoWoS / advanced 2.5D packaging
compute die 与 HBM 的高带宽集成
产能、良率、substrate、客户排产
EMIB / Foveros / chiplet integration
异构 die 集成、die-to-die 互连
标准、热、良率、设计复杂度
Glass substrate
更大 package、更细线宽、更高尺寸稳定性
量产能力、成本、可靠性
Artificial diamond / thermal material
高功耗密度下的散热
材料成本、封装集成、长期可靠性
GaN / SiC
power delivery、功率转换、效率
成本、工艺成熟度、系统设计
InP / photonics
高速光互连、光电转换
封装耦合、损耗、量产、生态
这里的机制可以概括成一句话:compute density 提升以后,package 里的 bandwidth、power、thermal 和 mechanical stability 会一起变难。
CoWoS 这类 2.5D 封装的核心价值,是让 compute die 和 HBM 以高带宽、短距离的方式连接起来。它解决的是 memory bandwidth 和能效问题,但也带来新的约束:interposer、substrate、封装设备、良率、测试和客户排产。需求暴涨时,客户缺的往往不是单颗芯片,而是一整套能把芯片、HBM 和封装一起交出来的产能包。
Chiplet integration 的意义超过了“把多个 die 拼起来”。它改变了设计和制造的边界。不同功能可以放在不同工艺节点上,良率和成本可以重新优化,定制化系统也更容易出现。但代价是系统复杂度上升:die-to-die 互连、热耦合、测试覆盖、封装良率和软件抽象都会变成工程问题。
Glass substrate、diamond、GaN、SiC、InP 这些材料方向,分别对应不同的物理约束。Glass 更多指向更大封装和更高尺寸稳定性;diamond 指向高功耗密度下的热路径;GaN / SiC 指向功率转换效率和高压高频场景;InP 和 photonics 指向高速光互连。它们不是同一个赛道,但背后有同一个压力源:传统 CMOS scaling 很难单独承担 AI 系统需求。
对 Intel 来说,这条线很关键。Intel 未必能让客户快速迁移整个 leading-edge foundry flow,但 advanced packaging 可能是更现实的切入口。客户可以先在封装、chiplet integration、HBM 连接、thermal 或 substrate 上验证 Intel 的能力,而不必一次性押上完整制程路线。
这里也要加一个边界。Packaging 本身同样是信任业务。没有产能、良率、成本和 customer support,advanced packaging 仍然只能停留在 capability demonstration。

9. Manufacturing capacity:所谓“回流”,更准确地说是冗余

💡
术语小抄:foundry 是晶圆代工,但这里讨论的 manufacturing capacity 不只是“有一座 fab”。客户真正依赖的是一整套交付能力:PDK、IP library、EDA flow、test chip、tape-out、silicon bring-up、yield learning、volume ramp。PDK 是工艺设计套件;IP library 是可复用模块库;tape-out 是设计定版送去制造;silicon bring-up 是样片回来后的上电、验证和调试;yield learning 是把良率慢慢爬起来;cycle time 是从投片到交付的周期。
访谈里关于美国制造、TSMC、台湾政府、印度、菲律宾、以色列和政府资本的讨论,应该放在制造冗余的框架里看。
“制造回流”这个词容易制造误解。它听起来像把全球供应链倒回某个国家边界内。现实不会这样。半导体供应链太长,设备、材料、EDA、IP、晶圆制造、封装、测试、客户设计分布在不同国家和公司。没有哪个国家能低成本复制全链条。
更严谨的概念是 redundancy:关键能力要有第二来源,关键路径不能完全依赖单一地理位置或单一供应商。
问题
回流叙事
Redundancy 叙事
目标
把制造搬回来
为关键能力建立可用第二来源
成本观
成本越低越好
愿意为韧性支付溢价
客户关注
政策正确
交付确定性、保密、周期、良率
成功标准
建厂数量
外部客户是否真实 tape-out / 量产
陈立武把美国政府入股和 TSMC 早期政府支持放在一起讨论,是在提醒一件事:foundry、AI factory、advanced packaging 和纯软件公司不同,它们需要长期资本,也需要国家层面的基础设施配合。政府资本、主权基金、长期增长基金和战略产业资本,都会进入这类项目。
但政府资本只能解决一部分问题。它能提供 runway 和信用,不能自动产生良率、客户信任和技术支持能力。半导体制造最终还是兑现行业:yield、defect density、cycle time、PDK、IP、EDA flow、customer support 这些指标无法用政策文件替代。
客户信任不是一句话。它是一条很长的链:
  1. PDK 够不够稳定;
  1. IP library 是否覆盖客户真实需求;
  1. EDA flow 是否成熟;
  1. test chip 数据是否可信;
  1. tape-out 到 silicon bring-up 的周期是否可控;
  1. yield learning 是否持续改善;
  1. defect density 是否进入客户可接受区间;
  1. volume ramp 是否按期;
  1. 下一代节点路线图是否值得客户继续绑定。
这就是 Intel Foundry 的核心难点。问题不在“有没有 fab”这个层面,而在客户是否愿意把未来几代产品路线图接到 Intel 的制造节奏上。
Foundry 是服务业,也是信任业。客户交给 foundry 的不是一张版图,而是未来几年的产品窗口。一旦良率、周期或客户支持出问题,损失不是一批 wafer,而是整个产品发布节奏。因此,Intel Foundry 要恢复的不是抽象声誉,而是一串具体指标。

10. Software / control plane:系统买回来以后,还要真的能用

陈立武谈未来赢家时提到 NVIDIA 的 platform 能力,尤其是 CUDA 和 library。这一段不能只当作对 NVIDIA 的礼貌性评价,它说的是 AI infrastructure 的另一半。
AI infrastructure 的客户买的不是裸芯片。客户买的是一个能训练、能推理、能调优、能招聘工程师、能迁移 workload、能观测、能排障、能持续优化的系统。NVIDIA 的护城河也不只是单颗 GPU,而是硬件、CUDA、libraries、networking、developer ecosystem、系统集成和客户习惯的组合。
这解释了为什么 “full stack” 在访谈里反复出现。Full stack 并不要求一家公司自己做完全部环节。它更接近一种系统控制能力:
  • 能理解 workload;
  • 能定义硬件和软件边界;
  • 能把客户应用映射到系统架构;
  • 能让上下游一起交付;
  • 能提供可观测、可调优、可维护的运行环境。
在 agentic AI 中,control plane 的价值会进一步上升。模型调用、工具执行、检索、权限、状态管理、routing、scheduling、cache、multi-agent orchestration 都需要软件层组织。CPU 的价值也需要放在这个上下文里看。
如果从 serving stack 看,这一层至少包括:
层次
做什么
为什么重要
Runtime / kernel library
kernel、collective、memory access、quantization
决定硬件能否跑出有效性能
Serving scheduler
batching、prefill / decode 调度、KV cache 管理
决定吞吐、尾延迟和成本
Cluster orchestration
GPU 分配、故障恢复、多租户隔离
决定规模化运行能力
Agent control plane
tool calling、state、权限、审计、routing
决定 agentic workload 能否进企业系统
Observability
tracing、profiling、cost attribution
决定系统能否被优化和运营
这一层解释了一个正在变清楚的现象:AI compute 的价值捕获越来越不像单纯硬件销售。谁控制 runtime、developer ecosystem、cluster scheduler 和 observability,谁就更接近客户 workload 本身。
Intel 的机会在于 x86 仍然处在大量 enterprise 和 server 基础设施里;风险在于平台价值不会自动从硬件份额里长出来。如果缺少与 accelerator、network、runtime、developer tooling 的深度连接,CPU 只是系统组件,不是平台入口。

11. AI 改变 company:不是只换工具,而是换组织能力

访谈后半段主持人问到 AI 是否会改变公司怎么工作,尤其是 software world 里,越来越多人开始管理多个 agents,招聘画像也在变化。陈立武的回答没有停在“用 AI 提效”这种泛泛表述上。他谈到 Intel 过去像一个 legacy spreadsheet company,现在要变成 AI-enabled company。
半导体公司不是纯软件公司。它有 fab、工艺、封装、EDA flow、客户项目、销售、供应链、质量控制。AI 如果只能帮市场部写文案,意义有限;如果能进入设计、验证、制造、客户支持和组织决策,它才开始改变公司本身。
可以拆成几层:
层次
AI 改变什么
对公司能力的影响
个人效率
写代码、写文档、生成分析、处理重复任务
单点效率提升,但不一定改变组织
工程流程
EDA、验证、debug、测试、设计空间搜索
缩短 cycle time,提高试错速度
组织协同
agents 承担信息整理、流程追踪、内部问答
减少 spreadsheet 和会议依赖
客户响应
更快理解客户 workload、配置方案、定位问题
customer engineering 变成竞争力
决策系统
预测需求、模拟产能、评估供应链风险
公司从经验驱动走向实时反馈
我觉得这一段的重点不在“AI 会让人少干活”。更大的变化是,公司会越来越像一个有内部 agent layer 的系统。过去很多组织能力藏在流程、表格、会议和老员工经验里;AI 把这些东西部分抽出来,变成可查询、可复用、可自动执行的能力。
这会改变招聘。主持人提到有些软件公司开始更看重 30、40、50 岁、管理复杂系统和团队的人,因为管理 agents 某种意义上像管理一组不会自发对齐目标的 junior team。这个观察很有意思。AI 时代不只奖励年轻人会用工具,也奖励那些知道怎么拆任务、设边界、验收质量、做取舍的人。
放到 Intel 身上,这意味着它不只是要补 software talent,还要把半导体老工程师的 domain knowledge 和新一代 AI 工具结合起来。陈立武提到自己要带进理解 workload、frontier model、open source 的新人才,这不是装点门面。Intel 如果要做 full stack,就必须有人能在模型、应用、芯片、封装、制造之间翻译。
所以 AI 改变 company 这条线,其实和前面的 supply chain 是连着的。供应链越复杂,组织越不能只靠表格和会议管理;应用变化越快,公司越需要用 AI 缩短反馈回路。

12. 瓶颈迁移以后,谁拿走定价权

前面几节讲的是“瓶颈在哪里”。再往下,就要问一个更现实的问题:瓶颈迁移以后,谁能拿到钱?
技术周期里,价值通常流向三个位置:
  1. 最难替代的 bottleneck owner;
  1. 能把多个 bottleneck 组织起来的 system integrator;
  1. 最接近客户 workload 的 platform controller。
放到 AI infrastructure 里,大概是这样:
参与者
可能捕获的价值
关键条件
NVIDIA
accelerator、networking、CUDA、system platform
继续控制 developer ecosystem 和 training / inference stack
TSMC
leading-edge manufacturing、CoWoS、客户路线图绑定
良率、产能、先进封装继续领先
HBM 厂商
memory scarcity 和客户锁单
HBM 代际、良率、封装协同能力
Cloud / hyperscaler
电力、客户入口、系统集成、模型服务
能把硬件稀缺转成服务能力
Intel
CPU、packaging、foundry redundancy、enterprise base
能证明良率、客户信任和软件连接
Startup
特定 bottleneck 的 wedge
客户痛点真实,且不容易被平台吸收
这张表里,最危险的是 startup。很多方向听起来都在“AI 基础设施”里,但可投资性不一样。一个瓶颈真实,不代表创业公司能拿到价值。平台公司可以内建,供应商可以降价,客户可以绕开,标准也可能把差异抹平。
创业公司的机会,通常要同时满足几个条件:
  • bottleneck 足够痛,客户愿意为它改变采购或架构;
  • 解决方案要能进入客户关键路径,而不是停留在 feature 层;
  • 迁移成本可控,不要求客户重写整套系统;
  • 有机会形成数据、工艺、软件或生态壁垒;
  • 第一客户能给真实验证环境,而非只给 logo;
这也是陈立武投资方法里“第一客户”很重要的原因。硬科技公司很少靠公开 demo 证明自己。它需要客户带着真实约束进来:成本、良率、功耗、延迟、可维护性、供应链风险。没有这些约束,技术容易显得过于完美。
对 Intel 来说,价值捕获的问题也在这里。它如果只卖 CPU,是组件供应商;如果能把 CPU、XPU、packaging、foundry、software 和 NVIDIA 合作组织成客户可用系统,才有机会进入更高层的价值池。

13. 硬科技投资先看 bottleneck,也要看资本结构

访谈里陈立武讲投资,反而比讲 Intel 本身更像一套可复用的方法论。他先问 bottleneck 是否真实、客户是否真的痛、第一客户是谁、团队能不能 pivot、投资人能不能带来产业资源。技术先进性排在这些问题之后。陈立武讲的不是普通 startup 方法论,而是 capital-intensive startup 的生存方法。
这套框架可以整理成六个问题:
问题
目的
负面信号
Where is the bottleneck?
判断方向是否真有系统约束
只是追热点,没有明确卡点
Is customer crying for it?
判断需求强度
客户只是试用,不愿迁移路线图
Who is the first customer?
判断是否能拿到真实反馈
没有 hyperscaler / strategic customer 参与
Can the team pivot?
判断长周期生存能力
单一 founder、听不进反馈、路径依赖重
Is the investor useful beyond money?
判断产业资源能否补位
只有资本,没有制造、客户或供应链通道
Can it become a wedge or a full-stack position?
判断长期议价能力
点状技术,容易被平台吸收或替代
这套框架适合 AI 半导体,因为这个行业同时具备四个难点:
  1. 技术周期长;
  1. capital intensity 高;
  1. 客户切换成本高;
  1. 量产和软件生态都可能拖慢商业化。
好的 startup wedge 通常能看到系统瓶颈并且试图给出自己的解决办法。访谈中提到的 optical interconnect、EDA + AI、materials、power management、memory connectivity,都是这种逻辑下的方向。
但光有 wedge 还不够。半导体和 AI infrastructure startup 还有一个更现实的问题:钱从哪里来,谁陪你走到量产。
软件公司可以用相对少的钱验证 PMF,再用增长数据融资。硬科技公司往往不行。你可能还没有收入,就要先拿下设备、测试、流片、封装、客户验证,甚至要和供应链一起排产。陈立武提到现在有 VC 愿意往一些公司里投十亿美元级别的钱,这在传统 VC 里并不常见。背后说明的是:AI infra startup 的资本结构正在变重。
这里至少有四类钱:
资本类型
能解决什么
解决不了什么
Early-stage VC
早期判断、团队组织、方向试错
很难独自支撑量产和长期 capex
Strategic investor
客户入口、制造资源、供应链协同
可能带来路线绑定和战略约束
Growth / mutual fund
大规模扩张资金、后续融资信用
未必懂技术和客户迁移风险
Government / sovereign / infrastructure capital
长周期基础设施、foundry、AI factory
不能替代良率、客户信任和执行力
所以,“投资人有用”在这个行业里不是一句客套话。钱只是入场券。真正有用的投资人,要能帮公司找到第一客户、接上制造资源、理解供应链约束、设计下一轮融资路径,甚至在 pivot 时帮团队判断方向。
这里需要避免两种误判:
  • 把所有瓶颈都当成投资机会。瓶颈真实,不代表创业公司有可进入的 wedge。
  • 把所有战略投资都当成验证。战略投资人可能带来客户和供应链,也可能只是财务参与。关键要看是否形成产品定义、验证环境和规模订单。
投资人能带来的价值也需要拆开。半导体公司不是只缺钱,它还缺客户入口、制造通道、封装资源、测试资源、供应链信用和下一轮资本。一个懂软件增长的投资人,未必能帮硬科技公司跨过量产门槛;一个懂制造的人,也未必懂开发者生态和 workload 变化。陈立武有意思的地方,是他同时站过 EDA、投资、运营和 Intel 这几个位置,所以他的问题通常更靠近真实交付。
还有一点很重要:startup 要准备好改方向。陈立武在访谈开头就说,他投的十家公司里,九家中途都会改 business plan,因为市场变了。这句话对 AI infra 尤其真实。模型架构会变,客户预算会变,供应链交期会变,平台公司也可能突然下场把你的 feature 吃掉。
所以他喜欢 team,而不是单一 founder;喜欢 open mind,而不是只会捍卫原始 pitch 的人。硬科技创业听起来像技术路线竞赛,最后经常变成一场连续 problem solving:客户不买怎么办,良率上不去怎么办,第一应用不够大怎么办,平台要内建怎么办,资本窗口关了怎么办。
在这个意义上,“startup” 和 “full stack” 不是矛盾的。小公司可以从一个窄 bottleneck 切进去,但必须知道自己最终会被谁集成、和谁合作、在哪个系统里创造价值。否则技术再漂亮,也可能只是一段会被吸收的 feature。

14. 最后还是要回到 application

视频最后一段还有一个判断,应该补进来。主持人问 compute 最终会在哪里,是越来越大的 data center,还是 edge、client、device 也会变重要。陈立武的回答很像投资人:不要只看 infrastructure buildout,最后要看 application。
这句话很关键。因为 AI infra 很容易让人只盯着供给侧:GPU、HBM、CoWoS、电力、data center。供给侧当然重要,而且现在确实紧。但长期看,不是所有基础设施投入都会赢。真正能穿越周期的,是那些被大应用持续消耗掉的 compute。
可以这样理解:
训练大模型会自然走向 centralized cloud,因为它需要大规模 GPU cluster、网络和电力。很多企业推理也会先走云,因为部署和运维更简单。但 robotics、defense、工业控制、自动驾驶、个人设备上的 agent,就未必适合全部放在云里。它们可能要求低延迟、离线能力、数据本地性、可靠性和安全边界。
这就把问题从“哪里算力最多”改成了“哪个 application 应该在哪里运行”。
陈立武提到 Amazon、Netflix 这类例子,大意不是说 AI 会复制互联网公司路径,而是说基础设施周期最后还是要由应用筛选。互联网时代也不是每个建站、视频、内容平台都赢了。真正活下来的,是抓住大应用、持续需求和商业模式的公司。AI 也会类似:有人赢很大,有人 sideways,有人被并购,有人消失。
这对 Intel 也重要。如果未来只有 centralized training 最重要,那 NVIDIA 的优势会继续很强。如果 agentic AI、physical AI、edge application 真的起来,CPU、client、edge、custom silicon、packaging、software control plane 的位置会变得更有意思。
供给链决定什么能交付,application 决定交付出来的东西有没有长期需求。

15. 回到 Intel:它有牌,但牌要打得出来

到这里,再回头看 Intel 会更清楚。
Intel 的重要性来自它同时触碰了这条 supply chain 的多个层级:CPU、foundry、advanced packaging、government capital、software talent、美国制造、enterprise customer base。这种组合确实少见。
但这些资产摊在账面上没有意义,能被组织起来才是优势。
Intel 资产
可能价值
主要风险
CPU / x86
agentic inference 和 enterprise control plane 中重新被定价
CPU 价值未必转化为 Intel 平台价值
Foundry
为美国和全球供应链提供第二来源
良率、cycle time、外部客户信任恢复慢
Advanced packaging
在 chiplet、HBM、heterogeneous integration 上切入
需要产能、良率、成本和客户项目验证
Government capital
提供长期制造投入信用
政策目标和商业目标不总一致
NVIDIA / SoftBank 资本与合作
带来生态信号和潜在产品整合
需要实际产品和客户采用证明
Software talent build-up
可能补足 AI system stack 短板
组织惯性和平台生态差距不易补
Intel 要证明的,是几个更具体的问题:
  1. 外部客户愿不愿意把关键产品交给 Intel Foundry;
  1. 18A / 14A 等节点能否在良率、cycle time 和 defect density 上给出可信数据;
  1. Advanced packaging 能否从技术能力转成大客户项目;
  1. Intel-NVIDIA 合作能否形成真实产品和软件路径;
  1. CPU、XPU、foundry、packaging、software 是否能构成系统方案,而不是各自为战。
陈立武在访谈里有一个很实际的表达:客户要的可能是“whole rack”。这句话值得认真看。客户不是来买某一颗芯片的参数表,而是要一个可部署、可维护、可扩展、可排障的系统。如果 Intel 的内部组织仍然按老式产品线各自优化,它就很难回应这种需求。
Intel 的难题,比“找到一个爆款产品”更复杂。它需要重建从客户问题回到系统架构的能力。CPU 团队、GPU 团队、foundry 团队、packaging 团队、software 团队、sales 和 customer engineering 必须围绕 workload 重新对齐。这个动作听起来像组织管理,实际上就是技术竞争的一部分。

16. 哪些情况会说明这篇文章判断错了

既然说 AI compute supply chain 的瓶颈在扩散,也要说清楚什么情况会让这个判断失效。
这篇文章的主判断是:AI compute supply chain 的瓶颈正在从单一 accelerator 扩散到 memory、packaging、power、interconnect、software 和 capital,并且这些瓶颈会重塑价值捕获。
下面这些情况会削弱这个判断:
可能的反例
会削弱哪部分判断
HBM 和 advanced packaging 很快大幅扩产,价格和交期明显回落
memory / packaging 稀缺性低于预期
模型架构显著降低 KV cache 和 memory bandwidth 压力
inference memory bottleneck 被缓解
Agentic AI 没有形成大规模企业级工作流
CPU / control plane 重估会延后
Optical interconnect 长期停留在试点,无法进入云厂商规模部署
data movement 新架构周期被推迟
Intel 外部 foundry 客户迟迟没有关键 tape-out 或 volume ramp
Intel redundancy 叙事缺乏工程验证
NVIDIA 继续把 CPU、network、runtime、rack system 全部打包得更紧
Intel 和其他参与者的切入口变窄
电力和数据中心建设速度超预期,供给紧张缓解
infrastructure bottleneck 的权重下降
AI 应用长期停留在少数云端场景,edge / agent / physical AI 没有起来
application 分散化和 CPU / edge 重估会被削弱
这里最值得跟踪的是前两项和第五项。前两项决定 supply chain 瓶颈迁移的强度,第五项决定 Intel case study 的可信度。
我仍然倾向于认为瓶颈扩散是大方向。原因不是某一家公司说了什么,而是 AI workload 本身正在把系统推到多个物理边界上:显存、带宽、封装、功耗、散热、并网、制造周期、软件调度。单点技术进步能缓解局部压力,但很难让整条链条同时变轻。

17. 后面看什么

如果把这期访谈当作后续观察框架,我会跟踪这些指标:
观察项
为什么重要
可能信号
HBM supply / capex
memory 是训练和推理共同瓶颈
SK hynix、Samsung、Micron 产能计划与客户锁单
CoWoS / advanced packaging capacity
决定 AI accelerator 能否形成系统出货
TSMC CoWoS 扩产、Intel packaging 客户项目
Data center power contracts
限制 AI cluster 部署节奏
云厂商电力采购、核电/燃气/可再生能源合作
Optical interconnect adoption
判断 data movement 是否进入新架构周期
云厂商试点、switch/NIC/package 集成进展
Intel external foundry customers
验证 Intel Foundry 信任恢复
真实 tape-out、量产计划、公开客户
Intel 18A / 14A yield and cycle time
决定 foundry 可信度
良率、defect density、客户验证反馈
Intel-NVIDIA integration
判断合作是否超越资本层面
产品 SKU、NVLink 集成、软件支持
EDA + AI startup traction
判断设计自动化是否进入新周期
大客户试用、flow 集成、验证效率指标
Inference serving economics
判断 agentic AI 是否改变系统采购
token 成本、KV cache 成本、tail latency、CPU/GPU ratio
Physical AI compute demand
可能打开 edge / real-time / robotics 需求
机器人、自动驾驶、工业系统的实际部署
AI application pull-through
判断基础设施需求是否可持续
企业 agent 工作流、机器人/defense/edge 应用、付费留存
这份 checklist 的作用,是把故事落到可观测变量上。只给叙事不够,读者还需要知道后面怎么验证。
比如:
  1. HBM + advanced packaging 的真实交期。这决定 GPU 之外的 supply chain 约束是否继续存在。
  1. Intel Foundry 外部客户的真实进展。不是意向,不是合作备忘录,而是 tape-out、良率和 volume ramp。
  1. Agentic inference 和 physical AI 的真实应用牵引。如果企业 agent workflow、机器人、defense、edge application 真的起来,CPU、memory、scheduler、observability 和端侧 compute 的价值会更快显现。

18. 结尾:AI infra 的稀缺性正在换位置

AI infra 的稀缺性,正在从“谁能拿到 GPU”,转向“谁能稳定组织 compute supply chain”。
这里的 compute supply chain 不是传统意义上的供应链表格,而是从 workload 到系统交付的一整条路径:模型需求、CPU/GPU/XPU、HBM、interconnect、package、materials、power、fab capacity、software runtime、客户信任和长期资本。
Intel 是这条路径上的一个大样本。它暴露的问题,也是整个行业接下来都会遇到的问题:硬件越来越像系统,系统越来越依赖软件,软件需求又不断把物理制造推到极限。
陈立武的访谈没有给出确定答案,但它把问题问到了正确层级。
下一阶段 AI 基础设施的竞争,不会只发生在单颗芯片上。它会发生在谁能把 power、memory、packaging、interconnect、manufacturing、software 和 capital 组织成稳定交付能力上。
这件事听起来没有模型发布会那么兴奋,但可能更接近 AI 产业的真实约束。

Reference

  • No Priors: Re-engineering the Semiconductor Supply Chain with Intel CEO Lip Bu Tan, 2026-06-18
  • Apple Podcasts 页面: https://podcasts.apple.com/us/podcast/no-priors-artificial-intelligence-technology-startups/id1668002688
  • Intel Newsroom: Intel Appoints Lip-Bu Tan as Chief Executive Officer, 2025-03-12。 https://newsroom.intel.com/corporate/intel-appoints-lip-bu-tan-chief-executive-officer
  • Intel Corporation: Intel and Trump Administration Reach Historic Agreement to Accelerate American Technology and Manufacturing Leadership, 2025-08-22。 https://www.intc.com/news-events/press-releases/detail/1748/intel-and-trump-administration-reach-historic-agreement-to
  • SoftBank Group: SoftBank Group and Intel Corporation Sign $2B Investment Agreement, 2025-08-19。 https://group.softbank/en/news/press/20250819
  • NVIDIA Newsroom: NVIDIA and Intel to Develop AI Infrastructure and Personal Computing Products, 2025-09-18。 https://nvidianews.nvidia.com/news/nvidia-and-intel-to-develop-ai-infrastructure-and-personal-computing-products
  • Intel Newsroom: Intel Unveils Industry-Leading Glass Substrates to Meet Demand for More Powerful Compute。 https://newsroom.intel.com/artificial-intelligence/intel-unveils-industry-leading-glass-substrates
  • Intel Foundry Packaging: Advanced Packaging Innovations。 https://www.intel.com/content/www/us/en/foundry/packaging.html
Loading...